تحلیل درستنمایی ماکزیمم مدل رگرسیون لجستیک در حالتی که داده های متغیرهای پیشگو کامل نیستند ولی متغیرهای کمکی وجود دارند

نویسندگان

محمد امین پورحسینقلی

m.a pohrhoseingholi dept. of biostatistic , shaheed beheshti, univeristy of medical sciences, tehran, iran (correspondinدانشجوی کارشناسی ارشد آمار زیستی, گروه آمار زیستی دانشکده پیراپزشکی , دانشگاه علوم پزشکی شهیدبهشتی حمید علوی مجد

h alavi majd ph.d: dept. of health and commuhity medicine school of medicine shaheed behesti university of medicاستادیار, گروه آمار زیستی , دانشکده پیراپزشکی , دانشگاه علوم پزشکی شهیدبهشتی علیرضا ابدی

a.r abadi ph.d: shaheed behesti university of medical sciences, terhan, iran.استادیار گروه پزشکی اجتماعی و بهداشت , دانشکده پزشکی , دانشگاه علوم پزشکی شهیدبهشتی سیمین پروانه وار

s parvanehvar shaheed behesti university of medical sciences, terhan, iran.دانش آموخته کارشناسی ارشد مامایی , دانشگاه علوم پزشکی شهیدبهشتی

چکیده

مقدمه و هدف: داده های گمشده در بسیاری از مطالعات آماری از جمله مدلهای رگرسیونی وجود دارند و باعث کاهش دقت برآورد می شوند. تا کنون روشهای گوناگونی برای مقابله با مشکل داده های گمشده ابداع شده که عموما بر داده های گمشده متغیر پاسخ متمرکز بوده است حال آنکه متغیرهای پیشگو نیز می توانند دستخوش تغییر و از دست رفتن اطلاعات شوند.مواد و روشها: در این تحقیق ضمن بررسی روش جانهِی داده هاِی گمشده با استفاده از الگوریتم em و متغیر کمکی, نتایج حاصل از این روش را با روش تحلیل مورد کامل در یک مدل رگرسیون لجستیک پیرامون عوامل مؤثر بر انتخاب نوع زایمان مقایسه می کنیم. یافته ها: داده هاِی مورد استفاده در این مقاله از یک مطالعه توصیفِی پیرامون عوامل مرتبط با انتخاب نوع زایمان در زنان مراجعه کننده به مراکز بهداشتِی و درمانِی شهر تهران بدست آمده است. حجم نمونه دراِین تحقِیق ۳۸۵ نفر بوده و از روش نمونه گِیرِی چند مرحله اِی انتخاب شدندو مشخصات فردی، سوابق ماماِیِی، نوع نگرش و عوامل اجتماعِی نمونه ها از طرِیق پرسشنامه ثبت شدند. براِی مقایسه میزان کارایِی دو روش، برآورد انحراف معیار پارامترها مورد استناد قرار گرفت. بحث و نتیجه گیری : نتایج حاصل نشان می دهد روش تحلیل درستنمایی با الگوریتم em در مقایسه با روش مورد کامل کارایی بهترِی دارد. مشکل داده هاِی گمشده در بسیارِی از مطالعات آمارِی وجود دارد و موجب اریبی و کاهش کارایی می شوند. در این بررسی نشان داده ایم استفاده از الگوریتم em براِی جانهِی گمشده هادر یک مدل رگرسیون لجستیک با متغیرهاِی توضیحِی گسسته و سپس تحلیل مدل، از روش مورد کامل که مستلزم حذف گمشده ها به همراه قسمتهایی از اطلاعات است کاراتر است. از سوی دیگر اگر متغیر توضیحِی ناکامل پیوسته باشد بدست آوردن مدل، روشی متفاوت می طلبد و یا می توان با تبدیل آن به متغیری گسسته از روش قبل استفاده کرد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مقایسه روش بیزی (Bayesian) و کلاسیک در برآرد پارامترهای مدل رگرسیون لجستیک با وجود مقادیر گمشده در متغیرهای کمکی

Background and Aim: Logistic regression is an analytic tool widely used in medical and epidemiologic research. In many studies, we face data sets in which some of the data are not recorded. A simple way to deal with such "missing data" is to simply ignore the subjects with missing observations, and perform the analysis on cases for which complete data are available. Materials and Methods: We c...

متن کامل

مدل رگرسیون لجستیک چند متغیره با داده های ناکاملی از متغیرهای مستقل

در مطالعات و آزمایشاتی که متغیر پاسخ گسسته است و دو یا بیشتر از دو مقدار را به خود اختصاص می دهد، مدل رگرسیون لجستیک به عنوان روش استاندارد آنالیز داده ها مطرح می شود. در این پایان نامه، ابتدا استفاده از پارامترهای میانگین جهت آنالیز رگرسیون پاسخ دو تایی چندگانه مطرح می شود. بدین صورت که با استفاده از نسبت های وابستگی تعریفشده در قالب پارامتر میانگین، ارتباط ها را مدلبندی می کنیم. نسبت های وابس...

به‌کارگیری متغیرهای پنهان در مدل رگرسیون لجستیک برای حذف اثر هم‌خطی چندگانه در تحلیل برخی عوامل مرتبط با سرطان پستان

Background and Objectives: Logistic regression is one of the most widely used generalized linear models for analysis of the relationships between one or more explanatory variables and a categorical response. Strong correlations among explanatory variables (multicollinearity) reduce the efficiency of model to a considerable degree. In this study we used latent variables to reduce the effects of ...

متن کامل

مقایسه‌ی دو رهیافت برای برخورد با متغیرهای کمکی گم‌شده در رگرسیون لوژستیک

در طول 2۵ سال گذشته پیشرفت‌های روش‌شناسانه‌ای در زمینه‌ی تیمار داده‌های گم‌شده صورت گرفته است. بیش‌تر مطالعه‌های انتشاریافته روی داده‌های گم‌شده در متغیرهای وابسته تحت شرایط گوناگون تمرکز داشته‌اند. مطالعه‌ی حاضر در پی آن است که این خلأ را با مقایسه‌ی دو رهیافت برای برخورد با داده‌های گم‌شده در متغیرهای کمکی رسته‌ای در رگرسیون لوژستیک پر کند: روش‌ امید ریاضی- ماکسیمم‌سازی (EM) وزن‌ها و جانهی چن...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
مجله اپیدمیولوژی ایران

جلد ۱، شماره ۱، صفحات ۶۵-۷۲

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023